Multidimensional Scaling

다차원 척도법(Multidimensional Scaling, MDS)
객체간의 근접성을 시각화하는 통계기법으로, 군집분석과 유사하다.

객체들 사이에 유사성 혹은 비유사성을 측정하여 원래의 차원보다 낮은 차원의 공간에 군집분석처럼 점으로 표현
객체들간의 거리는 유클리디안 거리행렬을 사용해서 계산한다.

개체의 실제 거리와 모형에 의해 추정된 거리 사이의 적합도를 측정하기 위해서
stress 척도를 사용한다.
stress 척도는 0과 1사이의 값을 가지며, 그 값이 낮을수록 적합도가 높다고 평가한다.
(일반적으로 0.05 이내이면 적합도가 좋다고 판단, 0.15 이상이면 적합도가 매우 나쁘다고 판단)
MDS 종류
계량적 MDS 비계량적 MDS
구간척도, 비율척도 서열척도
유클리디안 거리 행렬 서열척도를 거리속성으로 변환
R에서 'cmd scale' 함수 사용 R에서 'isoMDS' 함수 사용

> cal<-c(52, 160, 89, 57, 34, 32, 30, 69)

> car<-c(112.4, 8.5, 22.8, 14.5, 8.2, 7.7, 7.6, 18.1)

> fat<-c(0.2, 14.7, 1.3, 0.7, 0.2, 0.3, 0.2, 0.2)

> pro<-c(0.3, 2.0, 1.1, 0.3, 0.8, 0.7, 0.6, 0.7)

> fib<-c(2.4, 6.7, 2.6, 2.4, 0.9, 2.0, 0.4, 0.9)

> sug<-c(10.4, 0.7, 12.2, 9.9, 7.9, 4.7, 6.2, 15.5)

> fruits<-data.frame(cal, car, fat, pro, fib, sug)


> fruits_dist<-dist(fruits)

> fruits_loc<-cmdscale(fruits_dist)

> plot(x_loc, y_loc, type='n')

> text(x_loc, y_loc, rownames(fruits))

> abline(v=0, h=0)

x_loc, y_loc가 각각 무엇을 의미하는지는 알 수가 없다.
5, 6, 7 과일들은 비슷한 부류의 과일
1, 2 는 다른 과일과 다른 부류이다.